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事件 广泛 存在 于 人 类 的 活动 


续 地 产生 着 形形色色 的 事件 ， 
并 参与 到 周而复始 的 事件 处 理 活动 


分 布 式 事件 系统 (Distributed Event Based System, DEBS) 的 目 
高 效 地 分 发 给 感 兴趣 的 信息 消费 者 , 实现 一 个 事件 驱 


t 的 信息 事件 经 过 过 滤 或 者 加 工 处 


NI 


中 发 生 的 一 个 现象 、 一 条 新 闻 ， 人 金融 
单 ， 计 算 机 中 一 个 鼠标 移动 触发 的 消息 。 无 论 是 社会 、 日 常生 活 ， 还 是 计算 机 系统 
而 整个 社会 、 个 体 也 像 计算 机 一 样 , 都 在 被 各 类 的 事件 所 驱动 ， 


之 中 。 


理 ， 


为 的 、 松 厢 合 的 分 布 式 环境 。 
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DAL 


中 ， 其 粒度 或 大 或 小 、 类 型 包罗 万 象 。 事 件 既 可 
交易 中 的 一 个 实时 报价 ， 也 可 以 是 4 
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FE 要 研究 内 容 ， 并 介绍 我 所 在 该 方面 所 进行 的 


以 是 生活 
的 一 个 订 


， 都 在 持 


的 就 是 将 信息 生产 者 提 


分 布 式 事件 系统 被 广泛 应 用 在 实时 处 至 


E、 系 统 监 控 、 持 续 查 询 


(continuous query )、 业 务 流程 管理 等 领域 。 这 里 ， 信 息 的 生产 者 通常 被 称 为 “发 布 者 ” 


(Publisher)， 而 信息 的 消费 者 则 被 称 为 “订阅 者 ”CSubscriber)， 它 们 之 间 通 过 


络 (broker network) AEX. Å 


E 具 体 的 应 用 场景 中 ， 发 布 者 可 以 是 应 用 组 件 、 数 据 库 触 


发 器 、 传 感 器 设备 、 智 能 
Aeg) pr T. 
(subscription) 来 描述 


N? 


对 信息 消 


电网 终端 或 者 多 媒体 内 容 提供 商 等 等 ; 
bh 可 以 是 应 用 组 件 、 设 备 控制 器 、 数 据 库 等 。 订 阅 者 只 需 
趣 ， 而 分 布 式 事件 系统 的 ! 


费 的 兴 


(Publication) 与 订阅 之 间 在 频道 、 


进行 选择 性 路 由 ， 一 步 步 将 事件 的 


信息 分 发 


早期 事件 处 理 的 研究 者 来 自 数 
有 内 容 级 过 滤 与 处 理 能 力 的 事件 处 
派 、 形 成 独立 共同 
的 发 展 中 渐 呈 脉络 ， 逐 步 发 


体 的 催化 剂 。 这 种 基于 
展 成 型 。 
的 卡 扎 尼 格 CAntonio Carzaniga) 发 表 了 


据 库 、 


1998 年 ， 


给 感 兴趣 的 订阅 者 。 
分 布 式 系统 、 中 间 


此 经 


而 订阅 者 则 既 可 以 是 实时 


主题 乃至 内 容 上 的 匹配 关系 进行 计算 ， 


介 


个 中 介 网 


了 由 


结 点 则 对 发 布 消 , 
诈 根 据 匹 配 结果 


[iN 


件 、 软 件 工程 等 诸多 领域 ， 而 有 具 
理 技术 则 吸引 了 多 方 的 共同 关注 , 充当 了 汇聚 各 个 支流 分 
内 容 的 分 布 式 事件 
意大利 米兰 理 


处 理 研究 发 端 
工大 学 (Politecnico di Milano ) 


欧洲 ， 在 十 余年 


m 


的 博 


XA 


士 论 文 《可 扩展 至 广域网 的 事件 通知 服 


务 系统 架构 (Architectures for an Event Notification Service Scalable to Wide-area Networks )》， 


系统 地 冰 述 基于 内 容 的 分 布 式 事件 


年 拉克 纳 姆 (David Luckham) 教授 《 事 们 


通知 系统 的 模型 算法 和 实现 , 标志 着 该 研究 的 开端 .2002 


的 力量 : 分 布 式 企业 系统 中 的 复杂 事件 处 理 导论 


(The Power of Events: An Introduction to Complex Event Processing in Distributed 


Enterprise Systems)》 一 书 的 出 
之 中 。2003 年 ， 


域 。 为 了 进一步 
2002 以 来 ， 在 多 


任 动 分 布 式 事件 
伦 多 大 学 教授 雅 


版 ， 将 复杂 事件 的 处 到 
卡 扎 尼 格 同 沃 尔 夫 (Wolf) 在 SIGCOOM 上 首次 提出 了 “基于 内 容 的 网 络 
(Content based network)” YHE, -PENARE 
系统 领域 的 研究 工作 ， 为 而 
Etik (Hans Arno Jacobsen) 的 倡导 下 ， 分 布 式 事件 系统 
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E 技 术 纳 入 到 了 事 伯 


系统 研究 者 的 视野 


高 水 平 


系统 的 发 展 空间 扩展 到 了 网 络 领 
究 者 提供 


的 交流 平台 ， 自 


分 布 式 事件 系统 研究 概览 


的 研究 社团 开始 活跃 在 SIGMOD, ICDCS, ICSE 这 三 个 不 同 领域 的 顶级 国际 会 议 上 ， 组 织 
了 5 届 分 布 式 事件 系统 研讨 (Workshop )。 研 究 者 们 在 围绕 匹配 和 路 由 算法 进行 研究 的 同时 ， 
也 关注 诸如 事件 驱动 的 架构 、 服 务 计算 等 问题 ， 并 积极 研讨 分 布 式 事件 系统 的 教学 体系 和 课 
程 设 计 ， 开 始 形成 了 一 个 相对 独立 的 科学 共同 体 。2007 年 ， 高 德 纳 咨询 公司 (Gartner) 发 
布 了 一 项 报告 中, 宣称 事件 处 理 将 会 带 来 突破 性 的 创新 , 是 “下 一 个 大 家 伙 ”(Next Big Guy), 
事件 的 重要 性 开始 得 到 了 越 来 越 多 的 重视 。 同 年 9 月 , 高 德 纳 举 办 了 首届 Event Summit. (E 
件 处 理 峰 会 )， 吸 引 来 自分 布 式 事件 系统 学 术 界 以 及 IBM、 甲 骨 文 (Oracle)、 微 软 、CA 等 
大 型 公司 广泛 参与 。10 月 ， 第 一 届 ACM 分 布 式 事件 系统 会 议 在 多 伦 多 召开 ， 汇 集 了 该 领 
域 的 著名 学 者 和 工业 界 的 领军 人 物 ， 标 志 了 其 研究 社团 的 正式 形成 名。 在 这 段 时 期 ， 分 布 
式 事件 系统 技术 的 应 用 也 进入 到 了 加 速 发 展 的 阶段 , 在 传统 的 信息 分 发 所、 流程 管理 /企业 应 
用 集成 站 、 数 据 流 管理 外 等 等 的 基础 上 ， 进 一 步 扩展 到 了 博客 过 滤 四 、 自 组 织 (Ad Hoc) 网 
络 四 、 云 计算 外 、 智 能 电网 中 等 新 兴 领 域 。 


2 主要 研究 内 容 


~ 分 布 式 事件 系统 面临 的 一 个 突出 问题 就 是 整个 系统 的 “大 规模 ”(Large Scale) 特征 。 
这 里 所 指 的 大 规模 ， 主 要 有 以 下 几 个 含义 : 1) 并 发 事件 的 数量 极其 庞大 ; 2) 活动 的 订阅 数 
量 庞大 ， 并 且 订 阅 可 以 随 着 订阅 者 兴趣 的 变化 而 自主 更 新 ; 3) 发 布 者 或 者 订阅 者 群体 的 规 
模 庞 大 ，4) 整个 网 络 包含 的 节点 数量 多 ， 在 地 理 上 也 可 能 会 分 布 在 一 个 很 大 的 区 域 。 


在 这 样 一 个 大 规模 网 络 的 环境 中 ， 要 实现 海量 事件 的 按 需 、 高 效 、 可 靠 地 分 发 ， 事 件 
的 匹配 /过 滤 以 及 路 由 就 成 为 系统 的 两 个 基本 问题 。 作 为 一 个 可 用 的 分 布 式 系 统 所 必需 的 负 
载 均衡 、 容 错 、 移 动 、 安 全 等 技术 以 及 新 型 应 用 所 带 来 的 应 用 研究 近年 来 也 逐渐 成 为 分 布 式 
事件 系统 研究 的 新 热点 。 


2.1 事件 匹配 /过 滤 


事件 匹配 /过 滤 可 以 根据 其 过 滤 能 力 的 强 弱 简 单 地 划分 为 基于 频道 《Channel) 的 过 滤 、 
基于 主题 CTopic) 的 过 滤 和 基于 内 容 〈Content) 的 过 滤 三 种 类 型 。 


在 基于 频道 的 匹配 方式 中 ,事件 的 发 布 者 和 订阅 者 各 自选 择 相 应 的 频道 标识 AD), 事 

e 牛 的 过 滤 可 以 直接 通过 标识 的 匹配 来 完成 。 而 在 基于 主题 /类 型 〈SubjecVType) 的 方式 中 ， 
发 布 者 和 订阅 者 都 使 用 一 个 字符 串 或 者 类 型 (Type) 树 中 的 一 个 路 径 来 描述 发 布 内 容 和 订阅 
兴趣 ， 二 者 之 间 匹 配 与 和 否 就 可 以 通过 字符 串 匹配 或 者 类 型 之 间 的 相等 及 包含 关系 来 判定 。 


相 比 于 前 二 者 ， 基 于 内 容 的 过 滤 完 全 依赖 于 事件 的 内 容 进 行 匹 配 ， 具 有 更 为 强大 的 描述 
和 信息 处 理 能 力 ， 是 分 布 式 事件 系统 研究 的 焦点 。 我 们 可 以 简单 地 把 这 样 的 事件 系统 看 作成 
一 个 倒置 的 数据 库 : 其 中 的 查询 〈 订 阅 ) 相对 固定 ， 而 数据 〈 发 布 ) 则 是 动态 变化 的 。 事 件 
匹配 或 者 过 滤 的 目的 ， 就 是 在 持续 的 事件 流 上 ， 不 断 获得 满足 一 组 订阅 的 事件 集合 。 一 般 而 
言 ， 支 持 内 容 匹 配 和 过 滤 的 事件 模型 通常 包括 属性 / 值 对 模型 、XML 模型 以 及 RDF 模型 等 
不 同 的 模型 在 算法 处 理 上 也 有 所 不 同 。 
e 属性 / 值 对 (Attribute/Value pair) 模 型 
属性 / 值 对 模型 是 最 常用 的 模型 ， 这 个 模型 所 描述 的 事件 包括 一 组 属性 及 其 数值 。: 
型 系统 如 Grypon P, PADRES 3 等 都 是 采用 这 样 的 模型 。 在 这 样 一 种 模型 中 ， 一 个 发 
布 PP 就 是 一 个 “属性 - 值 ” 的 集合 。 一 个 发 布 P={(qy,V)…,(qi,Vi),…,(qan,Vn)， 由 信息 的 
生产 者 生成 。 其 中 ai ETE, vi 是 对 应 的 值 ， 可 以 是 包括 数值 型 数据 、 日 期 型 、 字 节 型 、 
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逻辑 型 、 字 符 串 型 乃至 自 定义 对 象 等 任意 数据 类 型 。 订 阅 S 包含 一 系列 属性 过 滤 条 件 
(Attribute filters )， 由 信息 的 消费 者 定义 。 每 一 个 过 滤 条 件 F; (0<i<n，n 是 自然 数 ， 
表示 过 滤 条 件 的 数量 ) 是 一 个 断言 “属性 -操作 符 - 值 ”。 可 以 定义 一 个 订阅 
S - (ai, Opi, vi)... (a; Opi, vi). (as, Op, v4) 


其 中 mi 是 属性 名 称 ; Op; 是 对 应 的 操作 ,可 以 包含 操作 “>”“<” 、“ =” *belongto" 
等 等 ， 也 可 以 包含 字符 串 运算 符 “contains”( 包 含 )、“eq”( 等 于 ) 等 等 。 如 果 没 有 约束 条 
牛 ， 还 可 以 用 “isPresent” 运 算 符 来 表示 该 属性 的 存在 。vi 仍然 是 aj 对 应 的 值 。 


如 果 一 个 发 布 P 满足 订 阅 S 的 所 有 过 滤 条 件 ， 则 称 P 与 $ 匹配 。 属 性 值 对 匹配 的 经 典 
算法 包括 : 滤波 器 算法 (Brute Force 算法 ， 也 就 是 集合 穷 举 算法 )、 计 数 器 算法 (Counting 
Algorithm)、 决 策 树 算 法 、 二 又 决策 图 算法 以 及 两 阶段 匹配 算法 等 等 。 


滤波 器 算法 也 就 是 采用 简单 的 集合 穷 举 的 方式 ,将 通知 消息 同 所 有 的 订阅 进行 匹配 。 如 
果 订 阅 的 所 有 条 件 都 满足 ， 则 返回 真 ， 和 否则 返回 假 。 这 个 算法 的 思想 简单 、 直 接 ， 但 使 用 这 
种 方法 会 导致 断言 的 重复 计算 ， 影 响 整个 系统 的 效率 。 


针对 上 述 算法 的 不 足 ， 严 (音译 ，Tak W. Yan) 中 提出 了 一 种 计数 器 算法 。 其 中 ， 每 个 
断言 指向 多 个 过 小 条 件 。 每 个 过 滤 条 件 包 含 一 个 初始 为 0 的 计数 器 , 在 每 一 事件 的 匹配 操作 
后 清 零 。 任意 一 个 事件 只 同 所 有 的 断言 进 匹配 ， 当 某 个 断言 被 匹配 时 ， 相 应 的 过 滤 条 件 的 计 
数 器 加 一 。 这 样 ， 当 某 个 过 滤 条 件 的 计数 值 等 于 其 所 包含 的 断言 总 数 时 ， 则 返回 匹配 判定 为 
真 ， 否 则 为 假 。 严 还 分 别针 对 断言 的 属性 、 操 作 和 什 建 立 了 三 层 索 引 ， 进 一 步 提高 了 算法 的 
执行 效率 。 


阿 奈 莱 拉 CM. K. Aguilear)“ “提出 的 决策 树 算法 以 过 滤 条 件 作为 叶子 节点 ,“ 属 性 和 操 
作 ” 作 为 非 叶 子 节 点 ， 所 有 的 边 则 是 “ 值 ?。 判定 过 程 就 是 对 决策 树 的 遍历 过 程 ， 能 够 从 根 
节点 出 发 ， 满 足 节 点 和 边 条 件 到 达 的 叶子 节点 返回 判定 值 为 真 ， 否 则 为 假 。 


计数 器 算法 和 决策 树 算 法 针对 具有 “与 ”关系 的 断言 构成 的 过 滤 条 件 设 计 ， 无 法 处 理 包 
含 “或 ”关系 的 过 滤 条 件 。 为 此 ， 卡 姆 帕 伊 拉 CA. Campailla) 呈 提 出 了 一 种 基于 二 又 决策 
图 (BDDS: Binary Decision Diagrams) 的 匹配 算法 。 其 中 包含 两 个 终结 节点 1 和 0。 一 个 
断言 构成 一 个 非 终结 节点 ， 包 含 两 条 出 边 ， 分 别 是 标志 断言 满足 的 高 边 〈High Edge) 和 标 
志 断 言 不 满足 的 低 边 〈Low Edge )。 断 言 的 一 条 出 边 指向 下 一 个 断言 或 者 终结 节点 。 他 还 提 
出 了 有 序 二 又 决 策 图 (Ordered Binary Decision Diagrams，OBDDs) 结构 ， 以 实现 多 个 过 滤 
条 件 之 间 的 共享 。 


两 阶段 匹配 算法 是 一 种 高 效 的 匹配 优化 算法 " ， 算 法 分 为 两 个 阶段 : 第 一 阶段 ， 找 出 
至 少 有 一 个 属性 匹配 发 布 的 所 有 订阅 子 集 ; 第 二 阶段 ， 利 用 计数 器 的 思想 ， 计 算 这 些 订 阅 条 
件 满 足 的 次 数 。 若 全 满足 ， 则 返回 该 订阅 匹配 结果 为 真 。 


€  XMI/RDF 模型 


x 


IL 


XML 模型 用 XML 来 描述 发 布 ， 用 XPath/XQuery 来 描述 订阅 。 阿 提 尼 尔 (M. Altinel) 
和 富兰克林 CM. J. Franklin) 05 针对 XML 信息 分 发 的 需求 ， 提 出 了 一 种 XFilter 方法 。 该 方 
法 将 XPath 描述 成 有 限 自动 机 (Finite State Machine, FSM) 。 当 XML 文件 中 的 条 件 不 断 
触发 一 个 有 限 自 动机 ， 并 使 之 到 达 接 受 状 态 CAccepting State) 时 ， 则 认为 该 XML 文件 与 相 
应 的 XPath 匹配 。 容易 看 出 ， 由 于 所 有 的 XPath 都 是 独立 的 ，XFilter 存在 同 滤波 器 算法 类 
似 的 缺陷 ,针对 这 个 问题 , 刁 艳 春 ( 音 译 , Yanlei Diao)[r] XFilter 的 作者 一 起 又 提出 了 YFilter09l 
算法 ,将 所 有 的 XPath 的 表达 式 合并 构成 一 个 非 确 定性 有 限 自动 机 (NFA: Nondeterministic 
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Finite Automaton)， 以 共享 不 同 表 达 式 之 间 的 公共 过 滤 条 件 ， 从 而 降低 匹配 运算 次 数 。 此 外 ， 
"kd C(Guoli Li) 0 还 提出 了 一 种 利用 属性 - 值 对 方式 实现 XML 描述 和 匹配 的 方法 ， 能 够 
有 效 地 提高 系统 的 匹配 速度 。 


皮特 洛 维 奇 CM. Petrovic) 以 基于 内 容 的 RSS (RDF Site Summery) 分 发 需求 为 背景 ， 
用 图 模型 来 描述 RDF 形式 的 发 布 与 订阅 ， 提 出 了 一 个 包括 发 布 Gp、 订 阅 Gs 以 及 本 体 
Ontoloty 的 G-TOPSS 模型 5。 这 样 ， 事 件 的 匹配 就 被 转化 成 了 一 个 图 匹配 问题 : X? Gs 与 
Gp 的 一 个 子 图 匹配 ， 则 认为 Gp 与 Gs 匹配 。 皮 特 洛 维 奇 还 提出 了 一 个 两 层 的 哈 希 表 结构 ， 
提高 了 系统 的 运行 效率 。 


e 扩展 的 模型 


基于 广播 的 模型 ”在 简单 的 基于 订阅 的 模型 中 , 订阅 信息 需要 洪 泛 到 整个 网 络 中 , 这 往 
往 会 带 来 巨大 的 通信 开销 。 考 虑 到 信息 发 布 者 的 数量 通常 会 大 大 小 于 订阅 者 的 数量 ， 人们 提 
出 了 基于 广播 的 模型 中 ， 让 数量 较 少 的 广播 进行 洪 泛 。 广播 (Advertisement) 可 以 看 作 是 发 
布 者 的 “公告 ”， 它 同 订阅 一 样 ， 包 含 一 系列 属性 过 滤 条 件 CAttribute filters), HR TA 
发 布 者 所 发 布 信息 中 每 个 属性 的 取 值 范围 。 任 一 洪 泛 到 网 络 上 的 广播 A 首先 与 订阅 进行 匹 
配 ， 得 到 与 该 广播 匹配 的 订阅 子 集 ， 则 广播 A 对 应 的 发 布 P 就 只 需 与 该 子 集 进行 匹配 ， 从 
而 降低 匹配 计算 的 量 ， 提 高 匹配 效率 。 


组 合 事件 /订阅 模型 “组合 事件 (Composite Event) 是 具有 关联 关系 的 事件 集合 .引文 [20] 
定义 了 事件 并 发 、 时 间 窗 口内 共 现 、 选 择 关 系 、 顺 序 关 系 等 基本 类 型 ， 并 提出 了 一 种 基于 有 
限 自动 机 的 建 模 方 法 。 这 种 事件 的 检测 和 匹配 则 可 以 使 用 有 限 自 动机 的 理论 来 求解 。 在 基于 
广告 的 模型 中 ， 李 国 莉 1 提出 的 组 合 订 阅 (Composite Subscription? 则 将 对 事件 的 需求 定义 
为 多 个 原子 订阅 之 间 的 布尔 运算 , 以 一 个 二 又 树 的 结构 表达 ,并 通过 单个 订阅 与 事件 的 四 配 
以 及 二 又 树 的 求解 来 实现 对 组 合 事 件 的 订阅 需求 。 二 者 相 比 , 组 合 订阅 仅仅 描述 了 所 期 望 事 
件 之 间 的 构成 关系 , 在 研究 上 侧重 于 路 由 算法 的 优化 ; 组 合 事件 更 细致 地 区 分 时 间 窗 口内 共 
现 、 事 件 并 发 和 顺序 等 不 同 的 关系 类 型 ， 具 有 更 强 的 表达 能 


2.2 事件 的 路 由 (Event Routing) 


从 网 络 结构 来 看 ， 分 布 式 事件 系统 的 网 络 包括 无 环 CAcyclic overlay) 和 有 环 (Cyclic 
overlay) 两 种 类 型 。 无 环 网 络 的 路 由 算法 相对 比较 成 熟 ， 而 有 环 网 络 的 路 由 算法 近期 一 直 是 
分 布 式 事件 系统 研究 的 一 个 焦点 。 从 路 由 表 结 构 来 划分 , 分 布 式 事件 系统 的 拓扑 结构 包括 两 
种 : 一 是 非 结构 化 的 覆盖 网 络 (Overlay); 另 一 种 则 是 结构 化 的 对 等 〈P2P) 网 络 〈 也 就 是 
基于 分 布 式 哈 希 表 的 网 络 一 DHT based Network)。 前 者 采用 与 Gnutella 网 络 ! 一 致 的 拓扑 结 
构 ， 采 用 经 典 的 路 由 算法 。 后 者 采用 基于 分 布 式 哈 希 表 忆 的 路 由 方法 ， 具 体 实现 时 多 同 集 
结 点 (Rendezvous Node) 路 由 相 结合 。 分 布 式 事件 系统 的 网 络 也 可 由 以 上 几 种 结构 加 以 组 
合 ， 形 成 层次 化 结构 或 者 混合 结构 ， 以 满足 不 同 的 应 用 需求 。 


常见 的 路 由 算法 包括 以 下 五 种 类 型 : 
@ ”基于 订阅 的 路 由 


如 图 1 所 示 ， 该 模型 首先 将 所 有 订阅 (比如 图 中 的 S1 和 S。) 洪 泛 到 整个 网 络 中 ， 当 新 
的 发 布 (Pub) 产生 后 ， 在 中 介 网 络 (Broker) 上 与 相对 应 的 订阅 Cub) 匹配 ， 然 后 按照 订 
阅 的 逆 路 径 ， 将 发 布 一 步 步 转发 到 订阅 所 连接 的 中 介 ， 并 由 该 中 介 将 信息 发 送 给 订阅 者 。 比 


! 一 种 文件 共享 网 络 
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如 图 1 rp. 发布 者 卫 所 产生 的 事件 n 满足 SARIE v2, ni 就 被 转发 给 了 So. CN T fij pole 
见 ,我 们 在 本 文中 假设 所 有 的 订阅 和 发 布 都 具有 一 个 属性 v)。 为 了 保障 新 产生 的 订阅 尽 可 能 
地 同 网 络 中 正在 路 由 中 的 发 布 相 匹 配 , 现 有 的 分 布 式 事件 系统 在 实现 上 往往 令 发 布 在 所 有 经 
过 的 路 径 上 的 中 介 都 进行 一 次 新 的 匹配 操作 ， 以 避免 遗漏 新 的 订阅 。 


e ”基于 广播 的 网 路 由 


如 图 2 所 示 ， 在 基于 广播 (Advertisement) 的 系统 中 ， 发 布 者 在 发 布 消 息 之 前 ， 需 要 首 
先 发 送 广播 消息 A, 将 自己 能 够 提供 的 信息 送 达 给 网 络 中 的 每 一 个 中 介 节 点 。 如 果 中 介 节 点 
上 :存在 同 广 播 内 容 相 匹配 的 订阅 信息 ， 则 订阅 者 (比如 图 中 的 S)» 的 订阅 信息 就 会 顺 着 广 
播 传播 方向 的 反方 向 ， 被 一 步 一 步 地 返回 给 发 布 者 直接 连接 的 节点 ， 形 成 “订阅 路 由 树 ”。 
由 于 Si 的 取 值 v>3， 不 满足 广播 消息 A 的 条 件 ，Si1 就 不 会 形成 针对 A 的 订阅 路 由 树 。 这 样 ， 
当 发 布 者 发 布 新 的 信息 《比如 图 中 的 n). 并 且 满 足 订 阅 约束 条 件 时 ， 发 布 消 息 就 会 沿 着 订 
阅 路 由 树 (比如 图 中 的 so 的 路 由 树 ) 从 叶子 结 点 逐步 回溯 ， 被 路 由 到 消息 订阅 者 连接 的 中 
介 节 点 ， 并 由 该 节点 将 消息 发 送 给 订阅 者 。 


<4- perem 
f TN 
SiV>3; SsiVv>2; nNi:v=3 E A:v<3; S2zv>2; ni1:v=3 
T » -—— — — e 一 
图 1. 基于 订阅 的 路 图 2. 基于 广播 的 路 
e 有 环 网 路 由 
卡 扎 尼 格 中 提出 了 一 种 支持 有 环 网 拓扑 结构 的 基于 内 容 的 路 由 策略 。 它 的 优势 在 于 采 
用 基于 距离 向 量 的 方法 建立 订阅 路 径 ， 从 而 使 得 事件 能 通过 最 短路 径 发 送 给 订阅 者 。 然 而 这 


个 方案 采用 丢弃 重复 消息 的 方式 ， 而 不 是 从 一 开始 就 避免 重复 消息 的 产生 , 会 产生 大 量 消息 
副本 。 此 外 对 处 于 环 上 的 订阅 ,它们 可 能 不 会 向 被 覆盖 订阅 方向 转发 匹配 的 事件 〈 如 果 那 个 
方向 不 是 被 覆盖 订阅 的 最 短路 径 )。 李 国 莉 ”” 提 出 了 一 种 新 的 基于 内 容 的 有 环 网 路 由 协议 
ECBR。 它 采用 了 带 广告 过 滤 占 的 方案 ， 并 为 订阅 的 过 滤器 指定 标识 这， 事件 根据 id 路径 的 
方式 避免 事件 环 路 上 的 重复 消息 传递 和 错误 。 由 于 在 ECBR 中 订阅 者 根据 广告 树 建立 了 多 
条 订阅 路 径 ， 因 此 在 这 些 订阅 路 径 的 重合 点 ,事件 能 够 根据 当前 的 网 络 情况 ,采用 启发 式 的 
方式 找到 一 条 最 佳 的 路 径 到 达 订 阅 者 ， 可 以 有 效 提高 路 由 效率 。 


o 集结 点 路 由 


在 集合 点 路 由 结构 中 ， 存 在 有 多 个 针对 
不 同事 件 类 型 的 集结 点 ， 一 个 集结 点 对 应 一 
种 或 者 多 种 事件 类 型 。 符 合 这 种 类 型 的 中 介 
结 点 同 该 集结 点 一 起 ， 构 成 了 一 个 独立 的 分 
发 子 图 。 整 个 网 络 还 可 以 通过 在 多 个 集结 点 
之 间 分 配 事件 类 型 来 实现 负载 均衡 。 


在 这 个 分 发 子 图 中 ， 订 阅 也 不 需要 进行 图 3， 集结 上 路 由 


TS 
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广播 。 如 图 3 所 示 ， 订 阅 S1 S, 首先 在 中 介 结 点 构成 的 网 络 中 路 由 ， 直 到 到 达 一 个 直接 连 
Bt R 的 中 介 结 点 ， 并 被 转发 到 R。 而 发 布 者 Pi 发布 的 事件 ni 如 果 在 发 往 R 的 路 径 中 碰 到 匹 
配 的 订阅 ， 则 直接 沿 着 订阅 的 逆 路 径 将 m 发送 到 订阅 者 。 比 如 图 中 n WRR Si PAR 
FARE, 再 被 转发 给 其 它 的 包含 有 满足 m 条件 的 中 介 结 点 , 并 最 终 发 送 给 相应 的 订阅 者 。 
比如 图 中 ni 被 发 送 给 5,。 由 于 网 络 中 的 一 般 中 介 节 点 都 需要 能 够 找到 针对 特定 事件 类 型 的 
集结 点 ， 人 们 往往 采用 基于 分 布 式 哈 希 表 的 方法 来 实现 集结 点 的 发 现 。 


e ”组合 事件 /订阅 路 由 


组 合 事件 的 路 由 和 组 合 订阅 的 路 由 有 相似 之 处 ， 引 文 [21] 提 出 的 组 合 订阅 路 由 具有 很 好 
的 代表 性 。 当 订阅 者 提交 组 合 订阅 后 ， 中 介 根 据 其 组 合 订阅 中 原子 订阅 所 匹配 的 广播 情况 ， 
将 组 合 订阅 一 步 步 加 以 分 解 ， 然 后 分 别 予 以 路 由 。 如 图 4 所 示 ， 由 原子 订阅 S, So. S. 构 
成 的 组 合 订阅 ， 在 中 介 节 点 Broker 2 上 先 分 裂 出 $3， 在 Broker4 上 分 裂 出 S; 和 5S,。。 这 种 方 
法 可 以 有 效 降低 组 合 订阅 的 转发 开销 。 


Broker2:(81&S2)ll S3 Broker4:S4&S; 
S, Vows (84&S5)ll 85 (S1&S3)ll S5 0 null 
| v9 v 
(6) 65 & 
Ps [Pss] 6) $ 5 6 
(a) (b) 


Ka. 组合 订 阅 的 分 解 路 由 方法 〈( 来 源 [21]) 


2.2.1 路 由 优化 
e XT E (Covering based Routing) 


若 订阅 S 的 过 滤 条 件 包 含 S, FH. Si 的 订阅 路 径 包 含 S 的 订阅 路 径 ， 则 订阅 S 能 够 
代表 5S, 的 订阅 兴趣 ， 即 订阅 S1 Wu (Cover) S. WE 5 所 示 ，Si 的 v 取 值 大 于 1，S， 的 
v 取 值 大 于 2， 则 si 覆盖 S。 在 这 种 情况 下 , 我 们 在 图 中 交汇 点 就 只 需要 继续 转发 订阅 S1, 
而 不 需要 转发 5$,。 在 共享 路 径 上 ， 对 于 任意 匹配 的 消息 (比如 图 中 n(v-3). S, S, I% 
受 消 息 。 这 样 既 可 以 有 效 减 少 订阅 转发 消息 量 ， 又 可 以 压缩 路 由 表 空 间 ， 提 高 匹配 效率 。 


S uu 
-5 -8 
n1:v=3; S2:v € [3,5]; 
n1:v=3; S2:v>2; S1:v>1; 一 > 
一 Pp 0 0 > S1:vE[4,6]; Sm:vE[3,6] 
UM > s 
图 5. 3ET4RSSITIRR I Ke. 基于 归并 的 路 由 


e ”基于 归并 的 路 由 (Merge Based Routing) 


基于 归并 的 路 由 同 基于 履 盖 的 路 由 具有 一 定 相似 之 处 53。 其 基本 思想 是 找 出 一 组 订阅 
(S; 的 过 滤 条 件 的 并 集 ， 生 成 一 个 新 的 订阅 5 来 作为 {Si} 的 代理 ， 
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Sm =SIUS USi USn 

这 样 , 在 Sn 与 {Si} 中 任意 订阅 的 重合 路 径 上 ，{f Si} 都 可 以 中 止 转发 。 如 图 6 所 示 , # S 的 
v 值 属于 [4,.6]，S$: 85 v 值 属 于 [3,5]， 我 们 就 可 以 生成 一 个 并 集 Sm: v 属于 [3,6] 来 替代 S1 和 S2 
路 由 。 然 而 ， 在 多 个 属性 值 对 的 复杂 订阅 集合 上 求 并 集 开 销 大 ， 且 如 何 确定 可 以 归并 的 订阅 
组 的 规模 ， 以 达到 最 佳 的 归并 效果 也 是 一 个 困难 的 问题 。 同 时 ， 归 并 路 由 有 时 会 导致 垃圾 信 
A: 与 归并 后 的 Sm 匹配 ， 但 与 群 组 中 任何 成 员 订 阅 都 不 匹配 的 发 布 事件 也 会 被 路 由 到 Sm 
的 起 点 ， 带 来 不 必要 的 消息 传递 开销 。 因 此 ， 相 对 于 基于 禾 盖 的 路 由 ， 基 于 归并 的 路 由 较 少 
使 用 。 


e ”兴趣 聚集 (Interest Clustering) 


如 果 相 似 的 订阅 共享 路 径 , 则 采用 基于 履 盖 的 路 由 优化 方法 可 以 大 大 减少 发 布 消息 的 数 
量 。 基 于 这 个 特征 ， 引 文 [26][27] 研 究 了 基于 订阅 者 集群 的 方法 。 其 基本 思想 是 将 整个 系统 
的 订阅 者 按照 订阅 的 兴趣 分 成 若干 个 组 ” "， 并 将 这 些 订 阅 以 组 为 单位 重新 聚集 ， 并 尽 可 能 
平均 地 分 派 到 临近 的 中 介 Broker) 上 ， 从 而 达到 提高 覆盖 路 由 优化 效果 的 目标 。 


2.3 其 它 研究 主题 


在 组 合 事件 的 基础 上 , 部 分 研究 者 进一步 考虑 了 多 事件 流 之 上 更 为 复杂 的 关联 关系 和 对 
更 强大 处 理 能 力 的 需求 , 开始 深入 研究 复杂 事件 处 理 技术 。 复杂 事件 处 理 技术 从 系统 的 角度 
出 发 加 入 事件 聚合 .分裂 以 及 简单 计算 等 操作 算 子 , 并 结合 数据 库 中 持续 化 查询 的 部 分 理念 ， 
引入 了 “滑动 窗口 ”等 新 的 时 间或 者 长 度 的 窗口 ， 更 好 地 满足 了 实际 的 应 用 需求 。XML 事 
件 匹 配 算法 一 一 YFilter 一 一 的 提出 者 刁 及 其 团队 在 复杂 事件 处 理 模 型 、 语 言 以 及 算法 等 方面 
作 了 一 系列 具有 广泛 影响 的 研究 工作 中 ， 其 他 学 者 也 在 射频 标识 《RFID〉 应 用 中、 分 布 
式 环境 下 的 优化 ”等 方面 作出 了 贡献 。 分 布 式 事件 系统 其 它 的 研究 主题 还 包括 : 算法 的 硬 
件 加 速 、 安 全 、 容 错 处 理 、 事 务 处 理 、 负 载 均 衡 等 等 。 


3 ”我 们 的 工作 


3.1 主要 研究 工作 


围绕 分 布 式 事件 处 理 的 核心 技术 及 其 应 用 模型 ， 我 们 开展 了 多 方面 的 研究 工作 ， 在 
OOPSLA, ICDCS, DEBS 等 软件 工程 、 分 布 式 系统 相关 领域 顶级 或 者 重要 会 议 上 发 表 了 一 
系列 的 学 术 长 文 。 


在 匹配 算法 方面 , 我 们 提出 了 基于 社交 和 概念 集成 网 络 的 事件 匹配 和 路 由 方法 ,并 将 之 
应 用 在 网 络 编程 论坛 的 问题 路 由 中 ， 有 效 提高 了 问题 的 匹配 效率 。 相 关 论 文成 为 继 IBM 中 
国 研 究 院 之 后 ， 第 二 次 被 OOPSLA 所 录用 的 来 自 中国 大 陆 的 文章 。 在 路 由 优化 方面 ， 我 们 
针对 有 环 网 缺乏 履 善 优化 路 由 方法 的 问题 , 提出 了 有 环 网 下 的 覆盖 路 由 协议 并 进行 了 形式 化 
的 证 明 ; 发 现 了 覆盖 优化 算法 在 取消 覆盖 关系 时 易 产生 巨 量 瞬间 消息 的 严重 缺陷 , 提出 了 一 
种 选择 性 取消 覆盖 路 由 算法 ， 显 车 提高 了 取消 覆盖 的 算法 效率 , 解决 了 系统 的 瓶颈 问题 。 我 
门 还 针对 分 布 式 系统 中 的 负载 均衡 和 任务 迁移 等 问题 , 重点 研究 了 客户 端 可 靠 迁 移 协议 及 路 
| 表 重 配置 优化 算法 、 分布 式 事件 系统 的 优化 部 署 方法 等 等 。 我 们 将 分 布 式 事件 系统 技术 应 
用 到 面向 服务 的 体系 结构 (Service-oriented architecture, SOA) 研究 中 ， 提 出 基于 事件 的 分 
布 式 资源 /服务 发 现 与 组 合 方法 ， 有 效 提高 了 运行 效率 。 将 部 分 算法 思想 应 用 到 了 海量 服务 
的 处 理 中 ， 以 5 组 15 项 全 项 满分 的 成 绩 赢 得 了 2009 年 国际 web 服务 竞赛 第 一 名 并 在 2010 
年 蝉联 第 一 。 


^ 
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3.2 智能 电网 应 用 

智能 电网 实时 事件 处 理 是 分 布 式 事件 系统 应 用 的 新 的 生长 点 , 也 是 我 们 研究 组 的 应 用 重 
点 。 

随 着 智能 电网 建设 工作 的 快速 推进 ， 智 能 电表 、 分 布 式 清洁 能 源 、 电 动 汽车 以 及 智能 家 
电 等 得 到 了 广泛 应 用 。 在 电网 末梢 用 电 环 节 , 巨 量 的 新 型 终端 设备 以 及 设备 与 电网 的 双向 互 


动 催生 了 海量 、 实 时 、 高 频 度 发 生 的 电网 事件 。 仅 我 国 一 个 省 级 试点 项 目 ， 就 涉及 数 千 万 终 
端 、 几 十 万 中 介 结 点 ， 一 个 采集 周期 的 事件 处 理 规模 达到 亿 级 。 为 了 应 对 这 些 挑战 ， 我 们 同 
世博 会 智能 用 电 展 厅 的 承建 方 国 网 信息 通信 公司 开展 了 技术 合作 , 在 前 期 研究 原型 
的 基础 上 ,结合 信 通 公司 丰富 的 智能 小 区 建设 经 验 和 迫切 需求 , 开发 了 高 通 量 事件 处 理 平 台 
LIT(fLexible hIgh Throughput event Processing platform for Smart Grid) 并 开始 进行 试点 应 用 。 


太阳 能 发 电 组 


Ex 
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事 伴 在 线 分 析 


< SESS 
” um» 数据 流 


E7. LIToÉ& RE 


LIT 有 点 燃 、 点 亮 、 高 举 等 意思 ， 意 在 切合 “创新 ， 点 亮 梦想 ”这 一 世博 会 国 网 馆 的 口 
号 。LIT 文 持 海 量 智能 电网 设备 端点 的 灵活 接 入 ， 提 供 了 一 个 大 规模 事件 的 过 滤 、 高 效 路 
和 分 布 式 存储 的 网 络 化 环境 ， 同 时 支持 复杂 事件 的 在 线 分 析 处 理 ， 为 巨 量 、 大 并 发 事件 在 接 
入 、 传 输 、 存 储 、 分 析 、 监 测 以 及 响应 、 控 制 等 全 生命 周期 所 涉及 的 信息 处 理 技术 提供 共性 
基础 支撑 。 


4 总 结 与 展望 


经 过 若干 年 的 发 展 ， 分 布 式 事件 系统 领域 已 经 初步 发 展 形成 了 一 个 活跃 的 学 术 研 究 社 
团 、 一 套 初 步 成 型 的 理论 体系 , 来 自 不 同 关联 领域 的 试验 性 应 用 也 正在 如 火 如 茶 地 开展 ， 形 
成 了 可 喜 的 形势 。 目 前 的 基础 性 的 研究 工作 ,， 既 能 为 未 来 分 布 式 事件 系统 技术 的 大 规模 应 用 
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商定 良好 的 基础 ， 也 已 经 并 将 继续 为 其 它 关联 学 科 提 供 许多 具有 参考 意义 的 算法 和 协议 。 


整个 分 布 式 事件 系统 技术 研究 已 经 初 共 规模 , 但 其 核心 的 关键 技术 和 应 用 模式 仍 在 


不 断 探索 之 中 。 企 业界 普遍 认为 我 们 对 于 分 布 式 事件 系统 仍然 处 在 “缺乏 充分 了 解 (Not Fully 
Understood)” 汪 的 阶段 。 在 这 种 背景 下 ， 研 究 分 布 式 事件 系统 中 的 核心 算法 以 及 其 新 型 应 


HRH 


有 明显 的 前 瞻 性 研究 和 应 用 价值 。 
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